Preprocesamiento de un corpus empleando corrección probabilística para precisar el vocabulario

نویسندگان

  • Viridiana Cruz-Gutiérrez
  • Mario Alberto Posada-Zamora
  • Maya Carrillo
  • Luis Enrique Colmenares Guillén
  • Abraham Sánchez López
چکیده

Resumen. La Organización Internacional del Trabajo estimó que en el 2012 exist́ıan 20.9 millones de v́ıctimas de explotación laboral y sexual forzada en el mundo. México ocupa el tercer lugar en trata de personas en América Latina y el Caribe. Particularmente, Puebla se encuentra entre los estados donde hay mayor vinculación de desaparición de mujeres y niñas con la trata y feminicidio. Ante esta situación estamos interesados en desarrollar herramientas que puedan ser utilizadas por padres y autoridades para la prevención de delitos ligados a trata de personas por Internet. El presente trabajo representa uno de los primeros pasos en esta dirección, se explora el preprocesamiento de un corpus de chats con contenido sexual empleando corrección probabiĺıstica, mediante teorema de Bayes. Para medir los efectos del procesamiento realizado, se trabajó en el agrupamiento de los documentos mencionados, empleando mapas auto-organizados. Los resultados obtenidos muestran que el procesamiento realizado mejora la efectividad del agrupamiento.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Un Multiplicador Digital de Frecuencia, de Alta Precisión y Alta Velocidad

n este artículo se presenta el diseño de un multiplicador digital de frecuencia basado en aritmética de módulo N, donde N es el factor multiplicador. Para N < 2 , siendo n un entero positivo, el circuito de corrección requiere de un sumador binario simple, y opera sobre (n+1) bits, manteniendo un error de frecuencia de salida con media de cero. Para valores prácticos de N, el esquema de correcc...

متن کامل

Corrección Automática de Huecos en Objetos de Forma Libre Empleando Funciones de Base Radial

Resumen—En este trabajo se propone un nuevo algoritmo para identificar y llenar automáticamente los huecos en regiones asociadas con superficies suaves mediante interpoladores de funciones de base radial locales. Abstract—In this work, a novel algorithm is proposed to identify and automatically fill the holes in regions associated with soft surfaces by means of interpolators of local radial bas...

متن کامل

Multiplicador Digital de Frecuencia Programable Adaptivo de Alta Presición

l uso de los multiplicadores digitales de frecuencia tiene su principal importancia en el campo del Procesamiento Digital de Señales, por la necesidad de acercar la frecuencia de muestreo a la frecuencia armónica que se interesa estudiar. Muchos tipos de multiplicadores digitales de frecuencia han sido planteados en las referencias [1] [10], donde los descritos en [1] y [3] son los que han apor...

متن کامل

Detección y diagnóstico de fallas en sistemas eléctricos de potencia (SEP) combinando lógica difusa, métricas y una red neuronal probabilística

Resumen. En el presente trabajo se propone un sistema para la supervisión de una red eléctrica con cambios de carga dinámicos propuesta por la IEEE. El sistema está compuesto por dos etapas. La etapa de detección utiliza un sistema de lógica difusa y la etapa de diagnóstico hace uso de las distancias Euclidianas entre líneas con el fin de generar un patrón dentro de los elementos del sistema, e...

متن کامل

Desarrollo de un analizador morfológico de catalán antiguo basado en corpus textuales

Resumen: Este proyecto retoma el desarrollo de un analizador morfológico de catalán antiguo públicamente accesible por Internet, el primero de su tipo.2 Pretendemos que este analizador se convierta en una herramienta útil para el tratamiento morfológico de corpus de catalán antiguo con fines didácticos y de investigación; además, será el primer módulo de un sistema futuro cuyo objetivo es ofrec...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Research in Computing Science

دوره 99  شماره 

صفحات  -

تاریخ انتشار 2015